首页> 外文OA文献 >Improved Deep Speaker Feature Learning for Text-Dependent Speaker Recognition
【2h】

Improved Deep Speaker Feature Learning for Text-Dependent Speaker Recognition

机译:改进了与文本相关的扬声器的深度扬声器特征学习   承认

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

A deep learning approach has been proposed recently to derive speakeridentifies (d-vector) by a deep neural network (DNN). This approach has beenapplied to text-dependent speaker recognition tasks and shows reasonableperformance gains when combined with the conventional i-vector approach.Although promising, the existing d-vector implementation still can not competewith the i-vector baseline. This paper presents two improvements for the deeplearning approach: a phonedependent DNN structure to normalize phone variation,and a new scoring approach based on dynamic time warping (DTW). Experiments ona text-dependent speaker recognition task demonstrated that the proposedmethods can provide considerable performance improvement over the existingd-vector implementation.
机译:最近提出了一种深度学习方法,以通过深度神经网络(DNN)导出说话者身份(d矢量)。该方法已应用于文本相关的说话人识别任务,并与常规i-vector方法结合使用时显示出合理的性能提升。尽管很有希望,但现有的d-vector实现仍无法与i-vector基线竞争。本文针对深度学习方法提出了两项​​改进:一种用于定义电话变化的依赖于电话的DNN结构,以及一种基于动态时间规整(DTW)的新评分方法。在与文本相关的说话人识别任务上的实验表明,与现有的矢量实现相比,所提出的方法可以显着提高性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号